多模态AI

Pixtral 12B

Pixtral 12B是一款由法国初创企业Mistral开发的多模态AI模型，能够同时处理图像和文本数据。该模型包含120亿参数，大小约为24GB，基于Nemo 12B文本模型构建。它具备强大的图像和文本处理能力，能够执行图像描述生成、统计照片中的物体数量等任务，并在多个基准测试中表现出色。Pixtral 12B将根据Apache 2.0许可证开源，用户可以自由下载和微调该模型。应用场景广泛，包括

AI项目与工具 2025年06月12日 69 点赞 0 评论 858 浏览

DeepSeek服务器繁忙怎么解决？16个免费R1满血版平替

本文介绍了16款可替代DeepSeek R1满血版的AI工具，涵盖本地部署、API调用及多平台解决方案。这些工具支持深度思考、联网搜索、多模态交互等功能，部分平台还提供高速专线、文档解析、图片识别等增强特性，满足不同场景下的AI需求。

AI项目与工具 2025年06月12日 62 点赞 0 评论 765 浏览

Omnitool

Omnitool是一款开源的AI桌面工具，提供统一界面整合多种AI模型，支持本地运行，保障数据隐私。兼容OpenAI、Stable Diffusion等主流平台，无需复杂配置即可实现图像生成、文本翻译、音频创建等功能。具备高扩展性，支持脚本和第三方工具集成，适用于从初学者到开发者的多场景应用，涵盖艺术创作、教育、企业开发等领域。

AI项目与工具 2025年06月12日 10 点赞 0 评论 713 浏览

Magma

Magma是微软研究院开发的多模态AI基础模型，具备理解与执行多模态任务的能力，覆盖数字与物理环境。它融合语言、空间与时间智能，支持从UI导航到机器人操作的复杂任务。基于大规模视觉-语言和动作数据预训练，Magma在零样本和微调设置下表现优异，适用于网页操作、机器人控制、视频理解及智能助手等多个领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 635 浏览

优雅YOYA

优雅（YOYA）是中科闻歌推出的多模态文生视频平台，基于大语言模型和多模态技术，支持从脚本生成到视频剪辑的全流程自动化。用户仅需输入主题，即可快速生成高质量视频，并支持语音克隆、口型翻译、数字人等功能。平台还具备多模态素材智能剪辑能力，提升创作效率与可控性，适用于媒体、影视、企业宣传及教育等领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 829 浏览

京点点

京点点是京东零售技术推出的AI内容生成平台，专为电商场景设计，支持商品图片、营销文案等多模态内容的高效生成。基于DiT框架、Flow Matching等先进技术，平台可精准提取商品信息并生成高质量素材，适用于多种电商场景。面向京东商家、合作伙伴及内部员工开放，助力提升内容生产效率与质量。

AI项目与工具 2025年06月12日 82 点赞 0 评论 731 浏览

混元图生视频

混元图生视频是腾讯混元推出的开源图生视频模型，支持用户上传图片并输入描述生成5秒短视频，具备对口型、动作驱动和背景音效自动生成等功能。模型适用于多种风格与场景，参数量达130亿，已在腾讯云上线并开源，支持本地部署与定制开发，适用于创意视频、特效制作及动画开发等多个领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 814 浏览

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型，能够处理音频、图像、视频和文本等多种输入，并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色，具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练，结合高质量音频数据提升性能，并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 623 浏览

GCDance

GCDance是一款由英国萨里大学与江南大学联合开发的3D舞蹈生成框架，可根据音乐和文本提示生成风格可控的全身舞蹈序列。它结合多粒度音乐特征融合与CLIP模型文本嵌入技术，实现舞蹈动作与音乐节奏的高度同步。支持多种舞蹈风格生成、局部编辑及高质量全身动作输出，适用于VR、游戏开发、舞蹈教学等场景。

AI项目与工具 2025年06月12日 36 点赞 0 评论 840 浏览

Character

Character-3 是 Hedra Studio 推出的全模态 AI 视频生成工具，支持图像、文本和音频输入，生成高质量动态视频。具备全身动作捕捉、情感控制、精准对口型等功能，适用于创意视频、虚拟形象、教育、营销等多个场景。采用多模态融合与先进 AI 技术，提升视频自然度与连贯性，提高内容创作效率。

AI项目与工具 2025年06月12日 66 点赞 0 评论 603 浏览

多模态AI

首页

多模态AI

列表

默认

浏览次数

发布日期